Loading...
机构名称:
¥ 1.0

我们如何训练辅助人机接口(例如,基于肌电图的肢体假体)将用户的原始命令信号转换为机器人或计算机的动作,如果没有事先映射,我们不能以用户的方式要求用户以行动标签或奖励反馈的形式进行监督,并且我们没有对用户的先验知识来实现​​这一任务?本文的关键想法是,无论任务如何,当接口更直观时,用户的命令就会噪音较小。我们将这个想法形式化为一个完全无监督的目标,以优化接口:用户的命令信号与环境中诱导状态过渡之间的相互信息。为了评估此相互信息得分是否可以区分有效和无效界面,我们对操作各种键盘和眼睛凝视接口的用户进行了大规模的观察性研究,用于打字,控制模拟机器人和玩视频游戏。结果表明,我们的共同信息得分可预测各种域中的基础任务完成指标,而Spearman的平均等级相关为ρ= 0。43。除了对现有接口的频道评估外,我们还使用无监督的目标从头开始学习界面:我们随机初始化界面,让用户尝试使用接口执行其所需的任务,测量共同信息分数,并通过强化学习更新界面以最大程度地提高界面。我们通过小型用户研究评估了我们的方法,他们使用扰动鼠标执行2D光标控制任务的参与者,以及与一个专家用户使用网络摄像头捕获的手势的专家用户进行的实验。结果表明,我们可以在不到30分钟的人类训练的情况下从头开始学习界面,而无需任何用户监督或事先了解任务。

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022PDF文件第1页

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022PDF文件第2页

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022PDF文件第3页

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022PDF文件第4页

arxiv:2205.12381v2 [cs.lg] 15 Sep 2022PDF文件第5页

相关文件推荐

2022 年
¥1.0
2022 年
¥2.0